22 research outputs found
Learning Adjustment Sets from Observational and Limited Experimental Data
Estimating causal effects from observational data is not always possible due
to confounding. Identifying a set of appropriate covariates (adjustment set)
and adjusting for their influence can remove confounding bias; however, such a
set is typically not identifiable from observational data alone. Experimental
data do not have confounding bias, but are typically limited in sample size and
can therefore yield imprecise estimates. Furthermore, experimental data often
include a limited set of covariates, and therefore provide limited insight into
the causal structure of the underlying system. In this work we introduce a
method that combines large observational and limited experimental data to
identify adjustment sets and improve the estimation of causal effects. The
method identifies an adjustment set (if possible) by calculating the marginal
likelihood for the experimental data given observationally-derived prior
probabilities of potential adjustmen sets. In this way, the method can make
inferences that are not possible using only the conditional dependencies and
independencies in all the observational and experimental data. We show that the
method successfully identifies adjustment sets and improves causal effect
estimation in simulated data, and it can sometimes make additional inferences
when compared to state-of-the-art methods for combining experimental and
observational data.Comment: 10 pages, 5 figure
Sex steroids and personality traits in the middle luteal phase of healthy normally menstruating young professional women
.10, F(1,57)=6.23, p=0.016). We were unable to find any association between the circulating androgens and scores on the masculinity-femininity scale (Mf). We were also unable to document any association between the weak adrenal androgens DHEA and DHEA-S and depression in contrast to several published reports. (c) Our data suggest a marginally significant association between progesterone and scores on the 7-Pt (obsessive/compulsive/psychasthenia) scale (r=0.27, p<0.05). However, only 7% of the 7-Pt variance was explained by progesterone (r 2 =0.071, F(1,50)=3.81, p=0.057). cONcluSIONS: We have found that total testosterone was associated with the paranoia score, the metabolic product of activated androgens, 3alpha-diolG, to social introversion and, finally, progesterone to obsessive-compulsive behavior
Neuromatch Academy: a 3-week, online summer school in computational neuroscience
Neuromatch Academy (https://academy.neuromatch.io; (van Viegen et al., 2021)) was designed as an online summer school to cover the basics of computational neuroscience in three weeks. The materials cover dominant and emerging computational neuroscience tools, how they complement one another, and specifically focus on how they can help us to better understand how the brain functions. An original component of the materials is its focus on modeling choices, i.e. how do we choose the right approach, how do we build models, and how can we evaluate models to determine if they provide real (meaningful) insight. This meta-modeling component of the instructional materials asks what questions can be answered by different techniques, and how to apply them meaningfully to get insight about brain function
Εκμάθηση αιτιακής δομής από αλληλοεπικαλυπτόμενα σύνολα μεταβλητών
Οι σύγχρονες μέθοδοι ανάλυσης δεδομένων (στατιστικής, μηχανικής μάθησης, εξόρυξης δεδομένων) εφαρμόζονται συνήθως σε ένα μεμονωμένο σύνολο δεδομένων, ανεξάρτητα από άλλες παρατηρήσεις και δεδομένα. Συγκεκριμένα, οι μέθοδοι
αυτές αδυνατούν να συν-αναλύσουν ταυτόχρονα σύνολα δεδομένων που περιέχουν διαφορετικά αλλά αλληλεπικαλυπτόμενα σύνολα μεταβλητών. Υιοθετώντας αιτιακά
μοντέλα αντί για τα συνήθη μοντέλα που βασίζονται (άμεσα ή έμμεσα)
αποκλειστικά σε στατιστικές συσχετίσεις, είναι δυνατή η εξαγωγή επιπλέον
συμπερασμάτων από την συν-ανάλυση των δεδομένων, σε σύγκριση με την
ανεξάρτητη ανάλυση του κάθε συνόλου δεδομένων.
Στην εργασία αυτή, υποθέτουμε ότι όλα τα σύνολα δεδομένων έχουν παραχθεί από ένα λανθάνον αιτιακό μοντέλο, που μπορεί να αναπαρασταθεί από έναν Μέγιστο Προγονικό Γράφο. Οι Μέγιστοι Προγονικοί Γράφοι είναι ένα είδος γραφικών μοντέλων ανεξαρτησίας σχεδιασμένο να μοντελοποιεί περιθώριες κατανομές και
καταστάσεις αιτιακής ανεπαρκειας (καταστάσεις όπου υπάρχουν κρυφές,
μη-παρατηρούμενες κοινές αιτίες).
Ορίζουμε το πρόβλημα της ταυτοποίησης ενός ή όλων των αιτιακών μοντέλων
συμφωνούν με όλα τα διαθέσιμα σύνολα δεδομένων. Προτείνουμε έναν αλγόριθμο, τον FCM, που μετατρέπει το πρόβλημα σε μια λογική πρόταση SAT της οποίας οι
αληθοτιμές αντιστοιχούν στα αιτιακά μοντέλα που εξηγούν τα δεδομένα.
Ορίζουμε επίσης ένα νέο γραφικό μοντέλο, τον Διμερή Αιτιακό Γράφο, που
συνοψίζει τις πιθανές διμερείς αιτιακές σχέσεις μεταξύ των μεταβλητών.
Βασιζόμενοι στον FCM, προτείνουμε τον cSAT+, έναν αλγόριθμο που παράγει τον
Διμερή Αιτιακό Γράφο από ένα σύνολο συνόλων δεδομένων, και αποδεικνύουμε ότι ο αλγόριθμος είναι σωστός και πλήρης όταν δεν υπάρχουν στατιστικά σφάλματα.
Στα υπολογιστικά μας πειράματα σε προσομοιωμένα σύνολα δεδομένων, δείχνουμε ότι η ενοποιημένη ανάλυση με τον cSAT+ επιτρέπει περισσότερα συμπεράσματα σε σχέση με την απομονωμένη, ανεξάρτητη ανάλυση των συνόλων δεδομένων από
υπάρχοντες αλγορίθμους. Παραδείγματα τέτοιων ενδιαφερόντων συμπερασμάτων
είναι η επαγωγή της απουσίας ή της παρουσίας άμεσης αιτιότητας ανάμεσα σε
μεταβλητές που δεν έχουν μετρηθεί μαζί. Αυτή η παρατήρηση έχει σημαντικές
επιπτώσεις στην ανάλυση δεδομένων, αφού δείχνει ότι επιπλέον αιτιακές
σχέσεις μπορούν να συναχθούν από δεδομένα ήδη διαθέσιμα, χωρίς τη διεξαγωγή επιπλέον πειραμάτων και μελετών. Σε σύγκριση με τον ΙΟΝ, τον πρώτο αλγόριθμο που λυνειένα παρόμοιο αλλά πιο γενικό προβλημα, ο cSAT+ έχει καλύτερη αποδοση και λύνει προβλήματα μεγαλύτερησ κλίμακας.Modern data-analysis methods are typically applicable to a single dataset. In particular, they cannot integratively analyze datasets containing different, but overlapping, sets of variables. We show that by employing causal models instead of models based on the concept of association alone, it is possible to make additional interesting inferences by integrative analysis than by independent analysis of each dataset.
Specifically, we assume that all datasets are generated by the a single overarching causal model representable by a Maximal Ancestral Graph; Maximal Ancestral Graphs are a class of graphical independence models
designed to model marginal distributions and cope with causal insufficiency (latent confounding variables).
We rigorously define the problem of identifying one or all causal models
that simultaneously fit the available data. We propose a novel algorithm FCM that converts this problem to a SAT formula whose solutions correspond to all plausible causal models. We also introduce a new
kind of graphical model, the Pairwise Causal Graph (PCG), that succinctly
summarizes all pairwise causal relations among the variables. Based on FCM, we propose cSAT+, an algorithm that outputs the PCG when given a set of
datasets and prove that this algorithm is sound and complete in the absence of statistical errors. In our empirical evaluation on simulated datasets, we show that the integrative analysis using cSAT+ makes more sound causal inferences than by analyzing the datasets in isolation. Examples of interesting inferences include the induction of the absence or the presence of some kind of causal relation between two variables never measured together. The latter observation
has significant ramifications for data analysis as it implies that additional causa